智能论文笔记

Sparse Continuous Distributions and Fenchel-Young Losses

André F. T. Martins , Marcos Treviso , António Farinhas , Pedro M. Q. Aguiar , Mário A. T. Figueiredo , Mathieu Blondel , Vlad Niculae

分类：机器学习 | 人工智能 | (统计)机器学习

2021-08-04

指数族在机器学习中广泛使用，包括连续和离散域中的许多分布（例如，通过SoftMax变换，Gaussian，Dirichlet，Poisson和分类分布）。这些家庭中的每个家庭的分布都有固定的支持。相比之下，对于有限域而言，最近在SoftMax稀疏替代方案（例如Sparsemax，$ \ alpha $ -entmax和Fusedmax）的稀疏替代方案中导致了带有不同支持的分布。本文基于几种技术贡献，开发了连续分布的稀疏替代方案：首先，我们定义了$ \ omega $ regultion的预测图和任意域的Fenchel-young损失（可能是无限或连续的）。对于线性参数化的家族，我们表明，Fenchel-Young损失的最小化等效于统计的矩匹配，从而概括了指数家族的基本特性。当$ \ omega $是带有参数$ \ alpha $的Tsallis negentropy时，我们将获得````trabormed rompential指数）''，其中包括$ \ alpha $ -entmax和sparsemax和sparsemax（$ \ alpha = 2 $）。对于二次能量函数，产生的密度为$ \ beta $ -Gaussians，椭圆形分布的实例，其中包含特殊情况，即高斯，双重量级，三人级和epanechnikov密度，我们为差异而得出了差异的封闭式表达式， Tsallis熵和Fenchel-Young损失。当$ \ Omega $是总变化或Sobolev正常化程序时，我们将获得Fusedmax的连续版本。最后，我们引入了连续的注意机制，从\ {1、4/3、3/3、3/2、2 \} $中得出有效的梯度反向传播算法。使用这些算法，我们证明了我们的稀疏连续分布，用于基于注意力的音频分类和视觉问题回答，表明它们允许参加时间间隔和紧凑区域。

translated by 谷歌翻译

T5QL: Taming language models for SQL generation

Samuel Arcadinho , David Aparício , Hugo Veiga , António Alegria

分类：机器学习

2022-09-21

自动SQL生成一直是一个活跃的研究领域，旨在通过以特定意图编写自然语言而不是编写SQL来简化对数据库的访问。语义解析的当前SOTA方法取决于LLMS在基准数据集上实现高预测精度。这降低了其适用性，因为LLMS需要昂贵的GPU。此外，SOTA方法是未接地的，因此不能保证始终生成有效的SQL。在这里，我们提出了T5QL，这是一种新的SQL生成方法，当使用较小的LMS（即T5-base）与SOTA方法相比时，可以改善基准数据集中的性能。此外，保证T5QL始终使用无上下文语法来限制SQL生成的有效SQL。最后，我们表明，在两项任务中进行语义解析，候选SQLS的生成和重新排名，是一个有希望的研究途径，可以减少对大型LM的需求。

translated by 谷歌翻译

Transfer Learning of Lexical Semantic Families for Argumentative Discourse Units Identification

João Rodrigues , Ruben Branco , António Branco

分类：自然语言处理

2022-09-06

论证挖掘任务需要知情的低到高复杂性语言现象和常识性知识的知情范围。先前的工作表明，预训练的语言模型在使用转移学习技术应用并建立在不同的训练前目标上时，在编码语法和语义语言现象方面非常有效。它仍然是一个问题，即现有的预训练的语言模型涵盖了参数挖掘任务的复杂性。我们依靠实验来阐明从不同词汇语义家族获得的语言模型如何利用识别论证话语单位任务的绩效。实验结果表明，转移学习技术对任务有益，并且当前的方法可能不足以利用来自不同词汇语义家族的常识性知识。

translated by 谷歌翻译

LudVision -- Remote Detection of Exotic Invasive Aquatic Floral Species using Drone-Mounted Multispectral Data

António J. Abreu , Luís A. Alexandre , João A. Santos , Filippo Basso

分类：计算机视觉 | 人工智能

2022-07-12

遥感是通过测量其反射和发射辐射在距离处检测和监测区域物理特征的过程。它广泛用于监测生态系统，主要用于保存。不断增长的入侵物种报告影响了生态系统的自然平衡。当引入新的生态系统时，外来的入侵物种会产生关键的影响，并可能导致本地物种的灭绝。在这项研究中，我们专注于欧盟被认为是一种水生侵入性物种的普发剂。它的存在会对周围的生态系统和人类活动（例如农业，捕鱼和航行）产生负面影响。我们的目标是开发一种识别物种存在的方法。我们使用了由无人机安装的多光谱传感器收集的图像来实现这一目标，从而创建了我们的Ludvision数据集。为了鉴定收集图像上的靶向物种，我们提出了一种检测路德维希亚p的新方法。在多光谱图像中。该方法基于修改以处理多光谱数据的现有最新语义分割方法。提出的方法达到了生产商的准确性0.799，用户的准确性为0.955。

translated by 谷歌翻译

Bayesian Structure Learning with Generative Flow Networks

Tristan Deleu , António Góis , Chris Emezue , Mansi Rankawat , Simon Lacoste-Julien , Stefan Bauer , Yoshua Bengio

分类：机器学习 | (统计)机器学习

2022-02-28

在贝叶斯结构学习中，我们有兴趣从数据中推断出贝叶斯网络的定向无环图（DAG）结构。由于组合较大的样本空间，定义这种分布非常具有挑战性，并且通常需要基于MCMC的近似值。最近，已引入了一种新型的概率模型，称为生成流网络（GFLOWNETS），作为离散和复合对象（例如图形）生成建模的一般框架。在这项工作中，我们建议使用GFLOWNET作为MCMC的替代方案，以近似贝叶斯网络结构的后验分布，给定观测数据集。从该近似分布中生成样本DAG被视为一个顺序决策问题，在该问题中，该图是根据学习的过渡概率一次构造一个边缘的。通过对模拟和真实数据的评估，我们表明我们的方法称为dag-gflownet，可以准确地近似DAG，并且它可以与基于MCMC或变异推断的其他方法进行比较。

translated by 谷歌翻译

HEROHE Challenge: assessing HER2 status in breast cancer without immunohistochemistry or in situ hybridization

Eduardo Conde-Sousa , João Vale , Ming Feng , Kele Xu , Yin Wang , Vincenzo Della Mea , David La Barbera , Ehsan Montahaei , Mahdieh Soleymani Baghshah , Andreas Turzynski

分类：计算机视觉

2021-11-08

乳腺癌是女性最常见的恶性肿瘤，每年负责超过50万人死亡。因此，早期和准确的诊断至关重要。人类专业知识是诊断和正确分类乳腺癌并定义适当的治疗，这取决于评价不同生物标志物如跨膜蛋白受体HER2的表达。该评估需要几个步骤，包括免疫组织化学或原位杂交等特殊技术，以评估HER2状态。通过降低诊断中的步骤和人类偏差的次数的目标，赫洛挑战是组织的，作为第16届欧洲数字病理大会的并行事件，旨在自动化仅基于苏木精和曙红染色的HER2地位的评估侵袭性乳腺癌的组织样本。评估HER2状态的方法是在全球21个团队中提出的，并通过一些提议的方法实现了潜在的观点，以推进最先进的。

translated by 谷歌翻译

Fair Tree Classifier using Strong Demographic Parity

António Pereira Barata , Frank W. Takes , H. Jaap van den Herik , Cor J. Veenman

分类：机器学习

2021-10-18

在处理自动化数据驱动的决策中的敏感数据时，一个重要的问题是学习具有高性能的预测因素对类标签进行高性能，同时最小化对从偏置数据引起的性别或种族的任何敏感属性的歧视。存在一些混合树优化标准，即结合分类性能和公平性。虽然无阈值ROC-AUC是测量传统分类模型性能的标准，但目前的公平树分类方法主要针对分类任务以及公平度量的固定阈值优化。在本文中，我们提出了一种复合分裂标准，其将无阈值（即，强）人口统计平价与Roc-Auc称为公允剧的Scaff - 分裂标准AUC - 并且容易延伸到袋装和提升的树框架。我们的方法同时利用多个敏感属性，其中值可以是多语言的或交叉的，并且可以针对不可避免的性能公平折衷来调谐。在我们的实验中，我们展示了Scaff如何在二进制，多语言和多敏感属性方面产生具有性能和公平的模型。

translated by 谷歌翻译

Learning Non-Monotonic Automatic Post-Editing of Translations from Human Orderings

António Góis , Kyunghyun Cho , André Martins

分类：自然语言处理 | 人工智能 | 机器学习

2020-04-29

最近的神经机翻译研究探索了灵活的发行订单，作为左右一代的替代品。然而，培训非单调模型带来了新的并发症：如何在同一最终结果到达的订单组合爆炸时搜索良好的订单？此外，这些自动排序如何与人类翻译的实际行为进行比较？目前的模型依靠手动构建的偏见或留下自己的所有可能性。在本文中，我们分析了人工后编辑所产生的排序，并使用它们培训自动编辑后系统。我们将生成的系统与由左右和随机编辑排序训练的人进行比较。我们观察到人类倾向于遵循几乎左右的顺序，而是有趣的偏差，例如首选通过纠正标点符号或动词而开始。

translated by 谷歌翻译